Classification multi-classe au prix d’un classifieur binaire
نویسندگان
چکیده
This paper deals with the problem of multi-class classification in machine learning. Various techniques have been successfully proposed to solve such problems, with a computation cost often much higher than techniques dedicated to binary classification. To address this problem, we propose a novel formulation for designing multi-class classifiers, with essentially the same computational complexity as binary classifiers. The proposed approach provides a framework to develop multi-class algorithms using the same optimization routines as those already available for binary classification tasks. The effectiveness of our approach is illustrated with Support Vector Machines (SVM), Least-Squares SVM (LS-SVM), and Regularized Least Squares Classification (RLSC).
منابع مشابه
Interprétation graphique de la courbe ROC
Résumé. L’aire sous la courbe ROC est un outil pertinent pour mesurer la performance d’un classifieur et possède de nombreux avantages par rapport aux mesures de rappel et précision par classe : la performance est indiquée par une seule mesure et ne dépend pas des populations des classes. Cet avantage se transforme néanmoins en inconvénient lorsqu’il s’agit, lors de la lecture de la courbe, de ...
متن کاملApprentissage incrémental anytime d'un classifieur Bayésien naïf pondéré
Résumé. Nous considérons le problème de classification supervisée pour des flux de données présentant éventuellement un très grand nombre de variables explicatives. Le classifieur Bayésien naïf se révèle alors simple à calculer et relativement performant tant que l’hypothèse restrictive d’indépendance des variables conditionnellement à la classe est respectée. La sélection de variables et le mo...
متن کاملClassification de questions par traduction
RÉSUMÉ. Dans cet article, nous nous intéressons à la classification de questions pour un système de questions-réponses en français. Faisant le constat d’un manque de corpus annoté en français, nous nous interrogeons sur la possibilité d’exploiter les corpus anglais existants, en utilisant des traducteurs automatiques. Nous avons mené une série d’expériences en faisant varier le sens de traducti...
متن کاملSegmentation de flux de documents. Application aux documents administratifs
RÉSUMÉ. Cet article propose une approche de segmentation supervisée de flux de documents. L'approche traite le flux de documents comme une suite de paires de pages et étudie la relation qui existe entre elles pour déceler une continuité de documents ou une rupture. Dans un premier temps, des descripteurs sont extraits des pages et une approche est proposée pour fusionner ces descripteurs en un ...
متن کاملOptimisation directe des poids de modèles dans un prédicteur Bayésien naïf moyenné
Résumé. Le classifieur Bayésien naïf est un outil de classification efficace en pratique pour de nombreux problèmes réels, en dépit de l’hypothèse restrictive d’indépendance des variables conditionnellement à la classe. Récemment, de nouvelles méthodes permettant d’améliorer la performance de ce classifieur ont vu le jour, sur la base à la fois de sélection de variables et de moyennage de modèl...
متن کامل